智能论文笔记

Spectrum of non-Hermitian deep-Hebbian neural networks

Zijian Jiang , Ziming Chen , Tianqi Hou , Haiping Huang

分类： (统计)机器学习

2022-08-24

具有复发性不对称耦合的神经网络对于了解如何在大脑中编码情节记忆很重要。在这里，我们将广泛的突触整合窗口的实验性观察整合到连续时间动力学中的序列检索模型中。理论上通过得出神经动力学中的雅可比矩阵的随机基质理论来研究具有非正态神经元相互作用的模型。这些光谱具有几个不同的特征，例如围绕原点的旋转对称性以及光谱边界内嵌套空隙的出现。因此，光谱密度高度不均匀地分布在复杂平面中。随机矩阵理论还可以预测过渡到混乱。特别是，混乱的边缘为记忆的顺序检索提供了计算益处。我们的工作提供了与任意时间延迟的时间隔离相关性的系统研究，因此可以激发对广泛记忆模型的未来研究，甚至可以激发生物学时间序列的大数据分析。

translated by 谷歌翻译

HTML版本

Multi-Domain Transformer-Based Counterfactual Augmentation for Earnings Call Analysis

Zixuan Yuan , Yada Zhu , Wei Zhang , Ziming Huang , Guangnan Ye , Hui Xiong

分类：机器学习 | 人工智能

2021-12-02

作为公开交易公司的定期电话会议，盈利呼叫（EC）已被广泛地研究作为企业基本面的高分析价值，作为基本的市场指标。最近的深度学习技术的出现在创建自动化管道方面表现出很大的承诺，使EC支持的财务应用程序受益。然而，这些方法认为所有包含的内容都是信息，而无需从长文本的成绩单中炼制有价值的语义并遭受EC稀缺问题。同时，这些黑箱方法具有在提供人为可理解的解释方面具有固有的困难。为此，本文提出了一种基于多域变换器的反事实增强，命名为MTCA，以解决上述问题。具体而言，我们首先提出基于变压器的EC编码器，以术语地量化关键额型欧共事位议对市场推理的任务启发意义。然后，开发了一种多域反事实学习框架，以评估具有充满丰富的跨域文档的有限EC信息文本之后基于梯度的变体，使MTCA能够执行无监督的数据增强。作为奖励，我们发现一种使用非培训数据作为基于实例的解释，我们将结果与案例研究显示。对现实世界金融数据集的广泛实验证明了可解释的MTCA的有效性，以提高最先进的最新的挥发性评估能力14.2 \％的准确性。

translated by 谷歌翻译

Domain Adaptation of Networks for Camera Pose Estimation: Learning Camera Pose Estimation Without Pose Labels

Jack Langerman , Ziming Qiu , Gábor Sörös , Dávid Sebők , Yao Wang , Howard Huang

分类：计算机视觉

2021-11-29

深度学习的关键批评之一是，需要大量昂贵且难以获得的训练数据，以便培训具有高性能和良好的概率功能的模型。专注于通过场景坐标回归（SCR）的单眼摄像机姿势估计的任务，我们描述了一种新的方法，用于相机姿势估计（舞蹈）网络的域改编，这使得培训模型无需访问目标任务上的任何标签。舞蹈需要未标记的图像（没有已知的姿势，订购或场景坐标标签）和空间的3D表示（例如，扫描点云），这两者都可以使用现成的商品硬件最少的努力来捕获。舞蹈渲染从3D模型标记的合成图像，通过应用无监督的图像级域适应技术（未配对图像到图像转换）来桥接合成和实图像之间的不可避免的域间隙。在实际图像上进行测试时，舞蹈培训的SCR模型在成本的一小部分中对其完全监督的对应物（在两种情况下使用PNP-RANSAC进行最终姿势估算的情况下）进行了相当的性能。我们的代码和数据集可以在https://github.com/jacklangerman/dance获得

translated by 谷歌翻译

Aerial Height Prediction and Refinement Neural Networks with Semantic and Geometric Guidance

Elhousni Mahdi , Zhang Ziming , Huang Xinming

分类：计算机视觉

2020-11-21

深度学习为许多计算机视觉任务提供了一种强大的新方法。来自航空图像的高度预测是那些从替代旧多视图几何技术的深度学习的部署大大受益的任务之一。这封信提出了一种两级方法，其中首先是多任务神经网络用于预测由单个RGB空中输入图像产生的高度图。我们还包括第二种细化步骤，其中用于产生更高质量的高度图。两个公开数据集的实验表明我们的方法能够产生最先进的结果。代码可在https://github.com/melhousni/dsmnet上获得。

translated by 谷歌翻译

Purifier: Defending Data Inference Attacks via Transforming Confidence Scores

Ziqi Yang , Lijin Wang , Da Yang , Jie Wan , Ziming Zhao , Ee-Chien Chang , Fan Zhang , Kui Ren

分类：机器学习

2022-12-01

Neural networks are susceptible to data inference attacks such as the membership inference attack, the adversarial model inversion attack and the attribute inference attack, where the attacker could infer useful information such as the membership, the reconstruction or the sensitive attributes of a data sample from the confidence scores predicted by the target classifier. In this paper, we propose a method, namely PURIFIER, to defend against membership inference attacks. It transforms the confidence score vectors predicted by the target classifier and makes purified confidence scores indistinguishable in individual shape, statistical distribution and prediction label between members and non-members. The experimental results show that PURIFIER helps defend membership inference attacks with high effectiveness and efficiency, outperforming previous defense methods, and also incurs negligible utility loss. Besides, our further experiments show that PURIFIER is also effective in defending adversarial model inversion attacks and attribute inference attacks. For example, the inversion error is raised about 4+ times on the Facescrub530 classifier, and the attribute inference accuracy drops significantly when PURIFIER is deployed in our experiment.

translated by 谷歌翻译

Simultaneous Estimation of Hand Configurations and Finger Joint Angles using Forearm Ultrasound

Keshav Bimbraw , Christopher J. Nycz , Matt Schueler , Ziming Zhang , Haichong K. Zhang

分类：机器人 | 计算机视觉

2022-11-29

With the advancement in computing and robotics, it is necessary to develop fluent and intuitive methods for interacting with digital systems, augmented/virtual reality (AR/VR) interfaces, and physical robotic systems. Hand motion recognition is widely used to enable these interactions. Hand configuration classification and MCP joint angle detection is important for a comprehensive reconstruction of hand motion. sEMG and other technologies have been used for the detection of hand motions. Forearm ultrasound images provide a musculoskeletal visualization that can be used to understand hand motion. Recent work has shown that these ultrasound images can be classified using machine learning to estimate discrete hand configurations. Estimating both hand configuration and MCP joint angles based on forearm ultrasound has not been addressed in the literature. In this paper, we propose a CNN based deep learning pipeline for predicting the MCP joint angles. The results for the hand configuration classification were compared by using different machine learning algorithms. SVC with different kernels, MLP, and the proposed CNN have been used to classify the ultrasound images into 11 hand configurations based on activities of daily living. Forearm ultrasound images were acquired from 6 subjects instructed to move their hands according to predefined hand configurations. Motion capture data was acquired to get the finger angles corresponding to the hand movements at different speeds. Average classification accuracy of 82.7% for the proposed CNN and over 80% for SVC for different kernels was observed on a subset of the dataset. An average RMSE of 7.35 degrees was obtained between the predicted and the true MCP joint angles. A low latency (6.25 - 9.1 Hz) pipeline has been proposed for estimating both MCP joint angles and hand configuration aimed at real-time control of human-machine interfaces.

translated by 谷歌翻译

EgoSpeed-Net: Forecasting Speed-Control in Driver Behavior from Egocentric Video Data

Yichen Ding , Ziming Zhang , Yanhua Li , Xun Zhou

分类：计算机视觉 | 机器学习

2022-09-27

速度控制预测是驾驶员行为分析中一个具有挑战性的问题，旨在预测驾驶员在控制车速（例如制动或加速度）中的未来行动。在本文中，我们尝试仅使用以自我为中心的视频数据来应对这一挑战，与使用第三人称视图数据或额外的车辆传感器数据（例如GPS或两者）的文献中的大多数作品相比。为此，我们提出了一个基于新型的图形卷积网络（GCN）网络，即Egospeed-net。我们的动机是，随着时间的推移，对象的位置变化可以为我们提供非常有用的线索，以预测未来的速度变化。我们首先使用完全连接的图形图将每个类的对象之间的空间关系建模，并在其上应用GCN进行特征提取。然后，我们利用一个长期的短期内存网络将每个类别的此类特征随着时间的流逝融合到矢量中，加入此类矢量并使用多层perceptron分类器预测速度控制动作。我们在本田研究所驾驶数据集上进行了广泛的实验，并证明了Egospeed-NET的出色性能。

translated by 谷歌翻译

Poisson Flow Generative Models

Yilun Xu , Ziming Liu , Max Tegmark , Tommi Jaakkola

分类：机器学习 | 计算机视觉

2022-09-22

我们提出了一种新的“泊松流”生成模型（PFGM），该模型将高维半球上的均匀分布映射到任何数据分布中。我们将数据点解释为$ z = 0 $超平面上的电荷，在增加额外尺寸$ z $的空间中，产生了高维电场（泊松方程解决方案的梯度）。我们证明，如果这些电荷沿电场线向上流动，则它们在$ z = 0 $平面中的初始分布将变成半径$ r $半球的分布，该分布在$ r \ to \ infty $限制中变成均匀。为了学习徒的转化，我们估计了增强空间中的归一化场。对于采样，我们设计了一种由物理上有意义的附加尺寸锚定的向后ode：当$ z $达到零时，样本击中了未加重的数据歧管。在实验上，PFGM在CIFAR-10上的正常流量模型中实现了当前的最新性能，其成立分数为9.68美元，而FID得分为2.48美元。它还可以与最先进的SDE方法相同，同时提供$ 10 \ times $至$ 20 \ $ 20 \ times $ $加速图像生成任务。此外，PFGM在较弱的网络体系结构上似乎更宽容估计误差，并且对Euler方法中的步骤大小稳健。该代码可在https://github.com/newbeeer/poisson_flow上找到。

translated by 谷歌翻译

EnergonAI: An Inference System for 10-100 Billion Parameter Transformer Models

Jiangsu Du , Ziming Liu , Jiarui Fang , Shenggui Li , Yongbin Li , Yutong Lu , Yang You

分类：机器学习

2022-09-06

大型变压器模型在各种自然语言处理（NLP）任务上显示出令人鼓舞的性能。尽管AI社区已将模型量表扩展到了万亿个参数级别，但由于延迟，吞吐量和内存约束，仍不确定100亿参数模型的实际部署。在本文中，我们提出了Energonai，以解决单个或多GPU系统上有效部署1000亿参数变压器模型的挑战。 Energonai采用层次结构控制器系统体系结构来协调多个设备并有效支持不同的并行模式。它将子模型的执行委托给单个控制器样式的多个工人，并以多控制器样式的工人之间的工人之间的张量并行性和管道并行性。在新的架构上，我们提出了三种技术，即非阻滞管道并行性，分布式冗余计算消除和同行记忆池。 Energonai使用户能够编程复杂的并行代码与串行编码相同。与FertransFormer相比，我们已经证明，Energonai在延迟和吞吐量方面具有较高的性能。在我们的实验中，Energonai可以在张量并行性，管道并行性的10％可伸缩性中实现37％的潜伏期降低，并通过使用较大的异质记忆空间以有限的性能降低的成本来提高对单个GPU推断的模型量表。

translated by 谷歌翻译

Improving RGB-D Point Cloud Registration by Learning Multi-scale Local Linear Transformation

Ziming Wang , Xiaoliang Huo , Zhenghao Chen , Jing Zhang , Lu Sheng , Dong Xu

分类：计算机视觉

2022-08-31

点云注册旨在估计两点云扫描之间的几何变换，在该点对应的估计中是其成功的关键。除了先前通过手工制作或学习的几何特征寻求对应的方法外，最近的点云注册方法还尝试应用RGB-D数据以实现更准确的对应关系。但是，有效地融合了这两种独特方式的几何和视觉信息并不是微不足道的，尤其是对于注册问题而言。在这项工作中，我们提出了一种新的几何感知视觉特征提取器（给出），该提取器采用多尺度的本地线性转换来逐步融合这两种方式，其中深度数据的几何特征是几何依赖于几何依赖的卷积内核来转换RGB数据的视觉功能。最终的视觉几何特征位于典型的特征空间中，由于几何变化引起的视觉差异可缓解，因此可以实现更可靠的对应关系。提出的给出的模块可以很容易地插入最近的RGB-D点云注册框架中。在3D匹配和扫描仪上进行的广泛实验表明，即使没有信件或姿势监督，我们的方法即使在没有通信或姿势的情况下也优于最先进的点云注册方法。该代码可在以下网址获得：https：//github.com/514DNA/llt。

translated by 谷歌翻译